iMeta | 大连海洋大学傅松哲和根特大学杨倩开发宏基因组测序和流式细胞术相结合的工作流程
点击蓝字 关注我们
宏基因组测序结合流式细胞术为城市污水中细菌病原体的微生物风险评估提供了新的框架
原文链接DOI: https://doi.org/10.1002/imt2.77
COMMENTARY
●2023年1月5日,大连海洋大学傅松哲团队和根特大学杨倩团队在iMeta在线发表了题为“Metagenomic sequencing combined with flow cytometry facilitated a novel microbial risk assessment framework for bacterial pathogens in municipal wastewater without cultivation”的文章。
● 本研究开发了一种新的工作流程,将宏基因组测序和流式细胞术结合起来,以表征污水中病原体的绝对丰度和毒力谱。该工作流程分别准确地估计了模拟群落和实际污水样品中病原体的绝对丰度,便于在未经培养的情况下进行准确的微生物风险评估。
● 第一作者:傅松哲、王蕊、徐征
● 通讯作者:傅松哲(fusongzhe@126.com)、杨倩 (qian.yang@ugent.be)
● 合作作者:周惠文、仇志光、杨雪灵、沈立新
● 主要单位:大连海洋大学设施渔业教育部重点实验室、深圳市盐田区人民医院、中国科学院深圳先进技术研究院生物医药与生物技术研究所、东北大学生命科学与健康学院、北京大学深圳研究生院环境与能源学院、西北大学中国西部资源生物学与生物技术教育部重点实验室、根特大学微生物生态与技术中心(CMET)
亮 点
● 开发了结合宏基因组测序和流式细胞术的工作流程
● 可精确地估计在模拟群落和真实样本中的病原体绝对丰度
● 从宏基因组数据集中收集的宏基因组组装基因组(MAGs)在系统发育分析和毒力分析中是稳健的
摘 要
本研究中,我们开发了一种新的工作流程,将宏基因组测序和流式细胞术结合起来,以表征污水中病原体的绝对丰度和毒力谱。该工作流程分别准确地估计了模拟群落和实际污水样品中病原体的绝对丰度,便于在未经培养的情况下进行准确的微生物风险评估。
视频解读
https://www.bilibili.com/video/BV1144y197kJ/
https://youtu.be/wm-8vBkrO3Y
中文翻译、PPT、中/英文视频解读等扩展资料下载
请访问期刊官网:http://www.imeta.science/
全文解读
前 言
污水微生物评估对于控制水传播疾病的感染风险至关重要。传统的污水微生物风险评估通常依靠病原体的分离培养,此方法通常不准确且耗时。由于基于qPCR的检测灵敏度高(低至每毫升1-10个拷贝(cp)),该方式越来越多地被用于临床和公共卫生环境中对单个病原体的常规监测。然而此方法要受到对目标病原预先了解的限制,且一次检测中只能同时检测几种病原体。因此,受限于病原体多样性和范围广泛,病原体的早期预警仍然存在技术瓶颈。
最近,环境宏基因组学正成为病原体监测的重要技术。理论上,这种方法可以检测所有病原体。近年来,宏基因组学的污水监测记录了城市污水中细菌病原体相对丰度(RA)的动态,这是一种检测当地社区病毒的新型早期预警工具。但由于总细菌负荷的季节性变化,RA估计值可能会与实际浓度不符。这些潜在的偏差可能导致对微生物风险的高估。为了解决上述问题,目前,已经开发了三种方法用于病原体的绝对定量:
第一种方法是对16S rRNA基因进行qPCR检测,以估计总细菌载量,再进行16SrRNA基因扩增子测序,以获得细菌群落的RA数据。单个细菌物种的绝对丰度可以通过将RA数据乘以qPCR得到的总细菌载量来推断。但由于不同的生物体包含不同的16S rRNA基因拷贝数,如何校正16S rRNA基因拷贝数仍然是微生物组调查中的一个问题。
第二种方法是在样品中加入已知绝对丰度的某个细菌物种(如大肠杆菌)作为内参。但由于不同物种的DNA提取效率差异很大,DNA提取后初始细菌组成会被干扰。因此,内参法在反映初始细菌组成的DNA水平上仍然不准确。
第三种方法:通过流式细胞术直接测量细菌总载量。通过将RA乘以总细菌载量来推断单个病原体的绝对丰度。但如果没有基于DNA回收效率的RA校正,这种方法仍然是不准确的。因此,保证RA数据和细菌总数的准确性对于接近绝对定量准确值是至关重要的。
为应对这一挑战,我们开发了一种新的工作流程,通过结合宏基因组测序和流式细胞术来推断三个模拟群落中的单个细菌浓度。结果显示,该工作流程可以很好地估计特定细菌病原体在沿海城市模拟污水和市政污水中的绝对浓度,并具有获得宏基因组组装基因组(MAGs)的额外价值,以同时评估病原体的毒性、抗生素抗性或功能。
结 果
工作流程的合理基础
通过宏基因组测序获得了细菌物种的RA值,并将其转换为绝对丰度。推断出单个病原体的数量,结合MAGs提供的毒力谱,能够证明模拟和真实水样中某些病原体的微生物风险(图1A)。
图1. 三个模拟群落中单个细菌种类的绝对定量
大范围细菌病原体的绝对量化和随后的城市污水微生物风险评估的工作流程(A);MAGS:宏基因组组装的基因组;ARGs:抗生素抗性基因;在校正之前和之后,通过MetaPhlAn3估计的三个模拟群落的相对丰度(B);A: Acinetobacter johnsonii; B: Photobacterium ganghwense; C: Acinetobacter pittii; D: Aeromonas bestiarum; E: Aeromonas caviae; F: Aeromonas caviae; G: Pseudomonas aestusnigri; H: Salmonella enterica; I: Bacillus stratosphericus; J: Bacillus stratosphericus; K: Bacillus cereus; L: Shewanella chilikensis; M: Vibrio cholerae; N: Shewanella xiamenensis; O: Vibrio diabolicus; P: Klebsiella quasipneumoniae; Q: Yersinia pseudotuberculosis; R: Citrobacter freundii; S: Enterococcus faecalis; T: Acinetobacter haemolyticus; U: Klebsiella quasipneumoniae; V: Vibrio antiquarius; W: Shewanella algae; X: Acinetobacter junii; Y: Klebsiella pneumoniae; Z: Other;三个模拟样本的均方根误差(RMSE ),提供了三种分类工具,并使用meta plan 3(C)进行了校正;绝对浓度相对于相对丰度的散点图(D);相对丰度组IC误差发生率柱状图(E);显示IC误差(方程4)的箱线图,去除了零推断浓度,表明整体IC误差率较低(F)。
RA估算方法的建立
首先建立了三个模拟样本,由2个、8个和32个细菌物种组成,样本序列组装大小从8.2到130 Mb不等。通过MetaPhlan3计算的细菌种类的RA被证明是用于RA估计的最准确的生物信息学工具(图2C)。
当考虑DNA提取效率的变化时,发现RA甚至更接近实际RA(图2B)。因此进一步评估了来自72个科的128种细菌的DNA提取效率,这些细菌代表了该区域河口的核心微生物群。DNA提取效率从9.6%到70.8%,中间值为41.6%。革兰氏阴性细菌也表现出明显更高的DNA回收效率。
三个模拟群落中单个细菌物种的绝对定量
使用流式细胞仪测定总细菌载量,测量的值与预期值一致,表明这种方法的可靠性。相比之下,使用基于通用16S rRNA基因的qPCR分析明显高估了总细菌载量(p<0.05)。接下来通过将细菌总数乘以每个物种的校正RA来计算推断浓度,结果显示,推断的细菌浓度与大多数物种的绝对浓度非常接近。线性回归显示了预期浓度和推断浓度之间的显著相关性(R2=0.974,p<0.01) (图2D)。
当进一步检查IC误差的来源时,发现大部分IC误差倾向于来源于RA较低的细菌种类(图2E)。结果显示,94.5%的IC误差是由低于5%的RA造成的(75.5%的误差是由低于0.1%的RA造成的),这表明低丰度的物种是IC误差的主要来源。与预期浓度关系的差异往往与物种浓度成反比(图2F)。因此,这种定量方法不适用于RA低于0.1%的病原体。
在三个模拟群落获得了MAGs以评估宏基因组归类的稳健性。MAGs的N50值在2317 ~ 300286之间,平均值为91402,表明MAGs质量良好。在H1和H2的样本中,回收了所有配制的菌种,而在H4的样本中,从32个细菌菌种中获得了28个MAGs。只有4种RA低于0.13%的物种未被检索到,表明病原体MAGs用于不经培养的微生物风险评估的可行性。
真实样品中细菌病原体的宏基因组学监测
为评估这一新工作流程的性能,测试了9个真实样本。从2021年5月到9月,在丹东市的城市污水中每半月进行一次采样,然后进行宏基因组测序。
流式细胞仪的结果显示,总细菌载量为7.42至9.32 log10 cells/L,五个月内变化为1.9 log10 cells/L(图2A)。在城市污水中大量检测到22种超过1000 cells/L的潜在细菌病原体,IC值在2.9至6.3 log10 cells/L之间。每个物种推断的个体丰度的动态变化显著,其中属于弧菌科和肠杆菌科的物种在7月和8月升至5.0 log10 cells/L以上(图2B)。
大多数物种在RA和IC之间表现出一致的趋势。但对于某些物种,在某些时间点的RA变化与IC变化不一致,IC变化通常发生在细菌负荷急剧变化或RA较低时。这些观察表明,单独用RA来指示微生物风险水平是不可靠的。
图2. 丹东市城市污水中细菌群落动态
(A) 2021年5月- 2021年9月属水平细菌群落相对丰度;实线为流式细胞仪测得的细菌总负荷的绝对浓度。柱状线表示属水平上细菌群落的相对丰度;(B) 2021年5月 - 2021年9月病原菌动态;圆圈的大小表示每毫升的细菌丰度,这是用细菌总负荷乘以每个个体物种的相对丰度计算得出的;灰色:宏基因组数据集中检测到的细菌种类;红色:纯培养的细菌种类。圆圈中的字母M表示在特定时间点MAGs的恢复。
用于鉴定毒力和抗生素抗性基因(ARGs)的MAGs的解析
为测试用6G数据集进行宏基因组测序是否足以进行毒力和ARGs分析,随后收集了从宏基因组数据集获得的重叠群。通过检查直接鉴定毒力基因和ARGs的MAGs。选择在相同时间点获得的14种病原体的MAGs和分离物进行比较。宏基因组归类成功地检索了在上述病原体MAGs中鉴定的所有关键毒力基因和ARGs。
讨 论
宏基因组测序结合流式细胞术实现了病原体的定量测定
此研究中,我们试图开发一个工作流程来同时评估单个细菌物种的丰度和毒力特征。首先建立了三个模拟细菌群落,以评估DNA提取和生物信息工具对单个物种RA的影响。结果表明,不同物种的DNA提取率差异很大,从9.5%到73.3%不等。接下来通过三种不同分类工具MetaPhlAn3,Kraken 和 Diamond进行测试,确定三种模拟群落物种分类的关键差异。相对于Kraken和Diamond,MetaPhlAn3在物种水平上具有更高的分辨率。在通过对DNA提取率进行补偿后,来自MetaPhlAn3输出的校正RA显示出与实际值更好的一致性。
在获得校正后的RA后,另一个问题是由于总细菌量的变化,单个物种的RA估计值经常不准确地反映实际浓度。我们试图在三个模拟群落中评估绝对定量方法的准确性,结果表明该方法提供了比通过通用16S rRNA基因进行分析更高的分辨率。此方法局限性在于,由于在宏基因组归类过程中许多重叠群会丢失,可能很难区分同一属内高度相似的物种。基于纳米孔的宏基因组测序可能会克服这一限制。然而,对来自模拟社区的MAGs的分析显示了物种分类具有100%的准确性,表明这种可能性很低。
将这套技术应用于沿海城市的城市污水的病原体监测。实际样品的结果也表明,推断的单个细菌计数与qPCR获得的六种选择的病原体的值显示出良好的一致性。MAGs的毒力谱也有助于确定某些病原体的毒力类型。
结 论
在这项研究中,我们开发了一个结合宏基因组测序和流式细胞术的工作流程,并评估了其对模拟和真实样品中特定病原体的绝对定量和微生物风险评估的稳健性。结果表明,该工作流程准确地估计了模拟社区和真实样本中病原体的绝对丰度。从MAGs中提取的基因组信息进一步对细菌毒力和ARG谱的微生物风险评估,从而在具有挑战性的环境中完成对新型强毒株的鉴定。
方 法
128种细菌DNA提取效率的测定
从中国微生物菌种保藏管理委员会普通微生物中心或以前的研究中获得了总共128个细菌培养物。这128个物种包括72个科94个属,占当地区域核心河口细菌群落的80%以上。取包含上述菌种的合成污水 (500 mL)通过上述GTTP膜(Merck Millipore)单独过滤并提取基因组DNA。
DNA提取效率的测量通过以下等式(1)计算:
DNA提取效率(%) =基因组拷贝数/细胞计数 (1)
个体物种的校正相对丰度(CRA)通过以下方程(2)推断:
其中RA(i)是物种I的相对丰度,DR是物种I的确定DNA提取率,CRA(i)是物种I的校正相对丰度,RA (1)到RA(n)表示物种1到物种n的相对丰度
在通过流式细胞仪获得总细菌负荷后,通过以下方程计算推断的单个细菌浓度(IC ):
其中,IC (i)是推断的物种I的单个细菌浓度。数据以log10标度表示。为了在使用log10标度时保持所有值有限,零推断浓度被映射为0。
细菌模拟群落的制备、宏基因组测序
为通过宏基因组数据集中的DNA提取和生物信息学工具评估给定病原体对RA的影响,从128个细菌物种中选择了2个、8个和32个细菌物种来构建三个模拟群落。通过吖啶橙直接计数法单独测量物种的总细胞计数。在分别将2个、8个和32个菌株混合在一起后,将每100 μl的单一培养物转移到试管中,最终形成三个模拟群落。制备DNA样品后通过Illumina NovoSeq测序仪平台进行测序。
推断浓度的准确性和界限的评估
为了评估推断浓度的准确度和边界,根据等式4定义IC的误差(IC误差)以评估准确度:
其中EC是单个物种的预期浓度,IC是单个物种的推断浓度。数据转换为相对丰度的log10值,并推断为预期浓度。
验证真实样品绝对定量的工作流程
2021年5月至9月在丹东市采集污水样本,于每个取样日上午9:00和下午3:00收集3升污水,汇集一起后提取DNA并测序。为评估RA和IC之间是否存在任何不一致,对六个物种进行了qPCR检测,包括鲍曼不动杆菌Acinetobacter baumannii、皮氏不动杆菌Acinetobacter pittii、豚鼠气单胞菌Aeromonas caviae、哈维弧菌Vibrio harveyi、阪崎克罗诺杆菌Cronobacter Sakazakii和海藻希瓦氏菌Shewanella algae。
代码和数据可用性
本研究的原始测序数据已提交至GenBank (NCBI),序列号为PRJNA860773
引文格式:
Fu, S., Wang, R., Xu, Z., Zhou, H., Qiu, Z., Shen, L., and Yang, Q. 2023. Metagenomic sequencing combined with flow cytometry facilitated a novel microbial risk assessment framework for bacterial pathogens in municipal wastewater without cultivation. iMeta e77. https://doi.org/10.1002/imt2.77
作者简介
傅松哲(第一作者兼通讯作者)
● 大连海洋大学副教授,硕士生导师
● 研究方向为微生物学与生物信息学,已在Water Research、mSystems、Clinical Infectious Diseases、iMeta等期刊发表学术论文40余篇,主持国家自然科学基金项目、省自然科学基金、省教育厅项目等多项课题
王蕊(共同一作)
● 大连海洋大学海洋科学学术硕士
● 目前研究方向为微生物组大数据分析与挖掘,相关学术成果已发表于iMeta、Science of the Total Environment等期刊
徐征(共同一作)
● 博士毕业于澳大利亚新南威尔士大学,现为深圳市盐田区人民医院博士后
● 研究方向:微生物与免疫方向,微生物物种及种群的进化分析以及多组学分析探索感染后的免疫效应,相关学术成果已发表于iMeta、Emerging Infectious Diseases等期刊
杨倩(通讯作者)
● 根特大学助理教授,博士生导师
● 研究方向为微生物学与生物信息学,已在Environmental Microbiology、mSystems、Science of the Total Environment、iMeta等期刊发表学术论文30余篇,主持国家自然科学基金项目、中国博士后基金项目、比利时弗兰德研究基金会项目等多项课题
更多推荐
(▼ 点击跳转)
高引文章 ▸▸▸▸
iMeta | 德国国家肿瘤中心顾祖光发表复杂热图(ComplexHeatmap)可视化方法
▸▸▸▸
iMeta | 浙大倪艳组MetOrigin实现代谢物溯源和肠道微生物组与代谢组整合分析
▸▸▸▸
iMeta | 高颜值绘图网站imageGP+视频教程合集
第1卷第1期
第1卷第2期
第1卷第3期
第1卷第4期
期刊简介
“iMeta” 是由威立、肠菌分会和本领域数百位华人科学家合作出版的开放获取期刊,主编由中科院微生物所刘双江研究员和荷兰格罗宁根大学傅静远教授担任。目的是发表原创研究、方法和综述以促进宏基因组学、微生物组和生物信息学发展。目标是发表前10%(IF > 15)的高影响力论文。期刊特色包括视频投稿、可重复分析、图片打磨、青年编委、前3年免出版费、50万用户的社交媒体宣传等。2022年2月正式创刊发行!
联系我们
iMeta主页:http://www.imeta.science
出版社:https://onlinelibrary.wiley.com/journal/2770596x
投稿:https://mc.manuscriptcentral.com/imeta
邮箱:office@imeta.science